CS205A HW5
课程主页:https://graphics.stanford.edu/courses/cs205a-13-fall/schedule.html
这次回顾作业5。
Problem 1
(a)
令第一个式子为$\vec 0$可得
因为$A$正定,所以$\vec x’ $是极小值点。
(b)首先考虑如何将两个向量变成$A-$共轭,假设两个向量为$\vec v_1, \vec v_2$,取$\vec w_1=\vec v_1$,设
要使得$\vec w_1, \vec w_2$为$A-$共轭,那么
不难看出
接着,假设我们已经有了$k$个$A-$共轭向量$\vec w_1 ,\ldots ,\vec w_k$,并且
现在讨论如何获得第$k+1$个$A-$共轭向量$\vec w_{k+1}$,假设
我们需要的条件为
那么$\forall 1\le i \le k$
显然有
上述讨论可以得到如下算法:
令
对$k=2…n$
对$i=1,\ldots ,k-1$,计算
Problem 2
(a)拉朗格朗日乘子为
所以KKT条件为
stationarity
primal feasibility
complementary slackness
dual feasibility
(b)令
记
那么
所以新的线性规划问题为
(c)对偶问题可以化为
记
所以stationarity条件为
带回原式可得
complementary slackness条件为
所以在最优解处
因为驻点唯一,所以如下方程的解唯一:
设上述方程的解为
所以最优解满足
因为原始问题的驻点唯一,所以原始问题的解唯一,设为$\vec x’$,那么最优解为
其中$\vec x ‘$满足
此即为对偶问题的解。注意(3)(4)和(5)(6)的形式一致,所以(3)(4)相等,即原问题和对偶问题的最优值相同。
Problem 3
(a)(i)取
(ii)因为
所以随机梯度下降法计算的梯度为
(b)(i)不一定,如果$f$无下界,那么无法收敛到局部最小值。
(ii)利用单调有界数列必收敛即可。
Problem 4
$\vec x$是Pareto optimal的含义为
(i)如果第一个条件不成立,即$\forall y,i$,
如果$f_i$全部相同,那么结论显然;如果$f_i$不全相同,那么不妨设$f_i \neq f_j$,那么必然存在函数值不相同的点$\vec x$,设
(b)首先由$f_i$的凸性以及$\vec \gamma \ge \vec 0$,我们可得$g$也是凸函数,所以存在最小值。接着将$\gamma_i$视为变量,所以得到如下优化问题
构造拉格朗日乘子:
关于$\vec x, \gamma$求梯度并为$0$可得
所以
对偶互补条件为
因为
所以
因此
以及
注意我们有
如果不存在$i ,\vec x $,使得
那么必然有
所以$\forall i,\vec x $,
此时$\vec x’ $是Pareto optimal。
如果存在$i ,\vec x $,使得
那么$\vec x’ $同样是Pareto optimal。
(c)感觉原题有误,$\vec x’$应该是Pareto dominate。
关于$\vec x $求梯度可得
因为$\forall i$
以及$\nabla^2 f_i(\vec x) \ge $(半正定),所以$\nabla^2 h(\vec x)$半正定,因此最小值点唯一。
注意$\forall \vec x \neq \vec x’$
所以必然存在$i$,使得
因此$\vec x’$是Pareto dominate。
Problem 5
(a)当满足如下条件时$f$取最小值
(b)
所以
所以
(c)显然
从这个角度来说这步更新是好的。
(d)注意最优点为
这和$\vec x_0 $的方向一致,但是和$\vec x_1 $的方向不一致,所以从这个角度来说不是一个好的更新。